我们提出了一种新方法,用于在使用机器人运动计划中使用技术的静态和动态场景中的重定向方法来计算转向用户在物理空间中的无碰撞路径上的重定向增益。我们的第一个贡献是使用来自运动规划和配置空间的概念重定向的数学框架。该框架突出了各种几何和感知的限制,倾向于使无碰撞重定向行走困难。我们使用我们的框架提出了一个有效的解决方案,以便重定向问题使用可见性多边形的概念来计算物理环境和虚拟环境中的自由空间。可见性多边形提供了可见的整个空间的简明表示,并且因此可以从环境内的位置到用户。使用可行性空间的表示,我们应用重定向步行以将用户转向物理环境中的可见性多边形区域,该区域与用户占据虚拟环境中的可见性多边形中的区域密切相关。我们表明我们的算法能够沿着路径转向用户,这些路径导致比静态和动态场景中的现有最先进的算法显着更少的重置。我们的项目网站可在https://gamma.umd.edu/vis_poly/提供。
translated by 谷歌翻译
我们提出了一种基于对齐的新型重定向步行控制器,允许用户探索大型和复杂的虚拟环境,同时最小化物理环境中的障碍物的碰撞次数。我们基于对齐的重定向控制器,弧形,使用户带动,使其对物理环境中的障碍物的邻近符合虚拟环境中的障碍物尽可能接近。为了在复杂环境中量化控制器的性能,我们引入了新的公制,复杂度(CR),以测量相对环境复杂性,并表征物理和虚拟环境之间的导航复杂性差异。通过广泛的仿真实验,我们表明电弧显着优于最新的最先进的控制器,其能够将用户转向无碰撞路径。我们还通过对具有许多障碍物的复杂环境中的具有稳健性的定量和定性措施来展示。我们的方法适用于任意环境,并且除了环境布局之外,没有任何用户输入或参数调整。我们在Oculus Quest头戴式显示器上实施了我们的算法,并在具有不同复杂性的环境中进行了评估其性能。我们的项目网站是在https://gamma.umd.edu/arc/提供的。
translated by 谷歌翻译
通用数据模型解决了标准化电子健康记录(EHR)数据的许多挑战,但无法将其集成深度表型所需的资源。开放的生物学和生物医学本体论(OBO)铸造本体论提供了可用于生物学知识的语义计算表示,并能够整合多种生物医学数据。但是,将EHR数据映射到OBO Foundry本体论需要大量的手动策展和域专业知识。我们介绍了一个框架,用于将观察性医学成果合作伙伴关系(OMOP)标准词汇介绍给OBO铸造本体。使用此框架,我们制作了92,367条条件,8,615种药物成分和10,673个测量结果的映射。域专家验证了映射准确性,并且在24家医院进行检查时,映射覆盖了99%的条件和药物成分和68%的测量结果。最后,我们证明OMOP2OBO映射可以帮助系统地识别可能受益于基因检测的未诊断罕见病患者。
translated by 谷歌翻译
ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列,该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战,这是由于探测器的几何形状,不均匀的散射和冰中光的吸收,并且低于100 GEV的光,每个事件产生的信号光子数量相对较少。为了应对这一挑战,可以将ICECUBE事件表示为点云图形,并将图形神经网络(GNN)作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开,对不同的中微子事件类型进行分类,并重建沉积的能量,方向和相互作用顶点。基于仿真,我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术,包括已知系统不确定性的影响。对于中微子事件分类,与当前的IceCube方法相比,GNN以固定的假阳性速率(FPR)提高了信号效率的18%。另外,GNN在固定信号效率下将FPR的降低超过8(低于半百分比)。对于能源,方向和相互作用顶点的重建,与当前最大似然技术相比,分辨率平均提高了13%-20%。当在GPU上运行时,GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件,这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。
translated by 谷歌翻译
本文通过讨论参加了为期三年的SubT竞赛的六支球队的不同大满贯策略和成果,报道了地下大满贯的现状。特别是,本文有四个主要目标。首先,我们审查团队采用的算法,架构和系统;特别重点是以激光雷达以激光雷达为中心的SLAM解决方案(几乎所有竞争中所有团队的首选方法),异质的多机器人操作(包括空中机器人和地面机器人)和现实世界的地下操作(从存在需要处理严格的计算约束的晦涩之处)。我们不会回避讨论不同SubT SLAM系统背后的肮脏细节,这些系统通常会从技术论文中省略。其次,我们通过强调当前的SLAM系统的可能性以及我们认为与一些良好的系统工程有关的范围来讨论该领域的成熟度。第三,我们概述了我们认为是基本的开放问题,这些问题可能需要进一步的研究才能突破。最后,我们提供了在SubT挑战和相关工作期间生产的开源SLAM实现和数据集的列表,并构成了研究人员和从业人员的有用资源。
translated by 谷歌翻译
当使用基于视觉的方法对被占用和空的空地之间的单个停车位进行分类时,人类专家通常需要注释位置,并标记包含目标停车场中收集的图像的训练集,以微调系统。我们建议研究三种注释类型(多边形,边界框和固定尺寸的正方形),提供停车位的不同数据表示。理由是阐明手工艺注释精度和模型性能之间的最佳权衡。我们还调查了在目标停车场微调预训练型号所需的带注释的停车位数。使用PKLOT数据集使用的实验表明,使用低精度注释(例如固定尺寸的正方形),可以将模型用少于1,000个标记的样品微调到目标停车场。
translated by 谷歌翻译
在本文中,我们提出了一种新的手工识别方法,以便犯罪调查,因为手形象往往是在严重犯罪如性虐待中的唯一可用信息。我们提出的方法,使用注意网络(MBA-Net)多分支,除了全球(不受注意)分支之外,还包含了分支机构中的通道和空间注意模块,以捕获歧视特征学习的全局结构信息。注意力模块侧重于手形图像的相关特征,同时抑制无关背景。为了克服注意力机制的弱点,等离性体到像素混洗,我们将相对位置编码集成到空间注意模块中以捕获像素的空间位置。对两个大型多民族和公共手部数据集进行广泛的评估表明,我们的提出方法实现了最先进的性能,超越了现有的基于手的识别方法。
translated by 谷歌翻译
在严重犯罪的情况下,包括性虐待,往往是唯一可以证明识别潜力的可用信息是手的图像。由于这种证据在不受控制的情况下捕获,因此难以分析。随着全局对特征比较的方法在这种情况下有限,重要的是要考虑当地信息。在这项工作中,我们通过学习全球和地方深度特征表示来提出基于手的人识别。我们提出的方法,全局和部分感知网络(GPA-Net),在Conv-Tother上创建全局和本地分支,以学习强大的歧视全局和零级功能。为了学习本地(零件级别)功能,我们在水平和垂直方向上对CONC层执行统一分区。我们通过进行软分区检索零件,而无需明确地分区图像或需要外部提示,例如姿势估计。我们对两个大型多民族和公开的手部数据集进行了广泛的评估,表明我们所提出的方法显着优于竞争方法。
translated by 谷歌翻译
While the brain connectivity network can inform the understanding and diagnosis of developmental dyslexia, its cause-effect relationships have not yet enough been examined. Employing electroencephalography signals and band-limited white noise stimulus at 4.8 Hz (prosodic-syllabic frequency), we measure the phase Granger causalities among channels to identify differences between dyslexic learners and controls, thereby proposing a method to calculate directional connectivity. As causal relationships run in both directions, we explore three scenarios, namely channels' activity as sources, as sinks, and in total. Our proposed method can be used for both classification and exploratory analysis. In all scenarios, we find confirmation of the established right-lateralized Theta sampling network anomaly, in line with the temporal sampling framework's assumption of oscillatory differences in the Theta and Gamma bands. Further, we show that this anomaly primarily occurs in the causal relationships of channels acting as sinks, where it is significantly more pronounced than when only total activity is observed. In the sink scenario, our classifier obtains 0.84 and 0.88 accuracy and 0.87 and 0.93 AUC for the Theta and Gamma bands, respectively.
translated by 谷歌翻译
There are multiple scales of abstraction from which we can describe the same image, depending on whether we are focusing on fine-grained details or a more global attribute of the image. In brain mapping, learning to automatically parse images to build representations of both small-scale features (e.g., the presence of cells or blood vessels) and global properties of an image (e.g., which brain region the image comes from) is a crucial and open challenge. However, most existing datasets and benchmarks for neuroanatomy consider only a single downstream task at a time. To bridge this gap, we introduce a new dataset, annotations, and multiple downstream tasks that provide diverse ways to readout information about brain structure and architecture from the same image. Our multi-task neuroimaging benchmark (MTNeuro) is built on volumetric, micrometer-resolution X-ray microtomography images spanning a large thalamocortical section of mouse brain, encompassing multiple cortical and subcortical regions. We generated a number of different prediction challenges and evaluated several supervised and self-supervised models for brain-region prediction and pixel-level semantic segmentation of microstructures. Our experiments not only highlight the rich heterogeneity of this dataset, but also provide insights into how self-supervised approaches can be used to learn representations that capture multiple attributes of a single image and perform well on a variety of downstream tasks. Datasets, code, and pre-trained baseline models are provided at: https://mtneuro.github.io/ .
translated by 谷歌翻译